指导四轴飞行器学会飞行
定义任务,定义智能体,训练你的智能体!
Criteria | Meet Specification |
---|---|
实现智能体 |
实现智能体的强化学习算法。 |
训练智能体 |
实现智能体的训练及学习。 |
绘制奖励图表
Criteria | Meet Specification |
---|---|
阶段奖励的图表 |
阶段奖励的图表用于展现智能体在一段时间内如何学习的状况。 |
反馈
Criteria | Meet Specification |
---|---|
问题1 |
提交的项目中注释了’任务’、’奖励’函数,使用奖励函数指导智能体的学习思路清晰。 |
问题2 |
提交的项目中,智能体函数有清晰注释。 |
问题3 |
提交的项目中,分析了阶段奖励图表。优秀作品能够展示阶段奖励图表中优化的学习路线。作品中需要尝试不同的优化算法设置(如超参数或复杂结构等),来训练并优化算法。 |
问题4 |
提交项目中,包含了完成项目后的经验及感悟,说明了将来能够用于优化算法的建议。 |